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LA META-EVALUATION AU SERVICE DE LA COMPREHENSION DE PROGRAMMES 


Daniel GOOSSENS 


Le programmeur expert qui écrit, étend ou modifie en parallèle 
plusieurs programmes participant tous d’un système unique, aura besoin 
d’un assistant qui dénonce interactivement les imperfections issues de 
son incapacité à contrôler l'organisation globale de ce système. 


C'est à étudier comment atteindre ce but qu'est consacré le système 
CAN, un système de compréhension automatique de programmes LISP, 
présenté dans cette étude. CAN est implémenté en VLISP [GREUSSAY 76 
77 78 79, CHAILLOUX 78a 78b 78cl et tourne sur un PDP-10 modèle KI-10. 
Il y occupe 20K mots de 36 bits. 

CAN a la capacité de déceler dans un système dont il ne connait pas 
L’ intention des particularités telles que : 


- portions de code non utilisées 

- classes de données pour lesquelles le calcul ne termine pas 
- redondances | 

- effets de bord indésirables 


La compréhension dont CAN est capable est fondée sur un processus 
compact de méta-évaluation. La méta-évaluation permet d'effectuer en 
un seul calcul symbolique une infinité de calculs particuliers. La 
méta-évaluation utilisée par CAN représente les connaissances au sujet 
de programmes sous forme de systémes d'équations et se charge de les 
résoudre. Elle sert à analyser dans un programme le flot des données, 
dans le but d'en exhiber des particularités (calculs infinis, portions 
de code non utilisées, chemins impossibles, redondances). La 
méta-évaluation utilisée par le système CAN répond à deux types de 
problémes posés par l'évaluation symbolique: 


- L'évatuation symbolique, dans ses réalisations actuelles [LONDON 74, . 
KING 75 76, BOYER 75b, YONEZAMA 75 76, BALZER 77, CHEATHAM 79] ne 
permet pas que soit décrit de facon symbolique autre chose que les 
valeurs associées aux identificateurs, dans un environnement. De ce 
fait, elle ne traite pas de nombreuses constructions,  fréquement 
utilisées en  LISP: variables  fonctionelles,  macro-génération 
dynamique de fonctions incomplètement spécifiées, définition de 
structures de contrôle. 


- Les résultats fournis par L’évaluateur symbolique sont souvent aussi 
peu transparents que le programme évalué symboliquement, surtout en 
ce qui concerne les programmes de traitement de listes. Les 
représentations traditionellement utilisées par L'évaluation 
symbolique, les formules de la logique des prédicats, n'exhibent pas 
plus que Îles programmes qu’elles annotent, les redondances, les 
classes de données pour lesquelles le programme ne termine pas son 
calcul, les propriétés utiles de programmes. 
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La META-EVALUATION utilisée par le système CAN augmente l'évaluation 
symbolique dans ces deux directions: 


- Elle l’étend aux constructions nouvelles permises par LISP: style 
applicatif, macro-génération de programmes, affectations  oü 
l’identificateur n'est pas explicité, structures de contrôle 


définies par l'utilisateur, appels à l'évaluateur, programmation 
incrémentale, entrées-sorties. 


- Elle repose sur un nouveau mode de représentation des données 
symboliques: les représentations conceptuelles [YONEZAMA 761. CAN 
est capable d'associer à un programme une représentation 
conceptuelle de son activité et de ses propriétés principales. 
Cette traduction en représentations conceptuelles a pour but 
d'isoler les problèmes de compréhension au sujet d'un complexe de 
programmes, sous forme d'équations à résoudre. CAN utilise alors 
des systèmes indépendants de résolution d'équations, spécialisés en 
particulier dans le traitement de listes. 


La méta-évaluation doit être utilisée et contrôlée par des systèmes 
plus larges de compréhension automatique de programmes. 


Considéré comme un système de compréhension de programmes LISP, CAN 
associe à un programme une définition sémantique, qui lui est 
équivalente, mais de laquetle il est beaucoup plus aisé d'extraire des 
propriétés importantes. Les langages de programmation, et LISP en 
particulier, déploient une immense variété de représentations de 
calculs, et permettent d'oblitérer des propriétés simples derrière des 
formules courtes, mais à la sémantique complexe. 

Pour CAN, comprendre un programme, c'est y associer sa représentation 
conceptuelle. Les représentations conceptuelles forcent L'extraction 
de ce qui est habituellement caché dans un programme: effets de bord, 
contrôle de l’évaluation, analyses de cas, structure dymamique des. 
objets manipulés par le programme. Etle peuvent ainsi isoler des 
particularités interessantes d’un programme, telles que: 


- effets de bord imprévus 

- classes de données pour lesquelles le calcul du programme ne 
termine pas 

- redondances 

- portions de code non utilisées. 


L'EVALUATION SYMBOLIQUE 


Il est possible de modifier un interprète pour qu'il tienne compte de 
la présence de valeurs abstraites dans l'environnement inote 1] d'une 
expression à évaluer. Evaluer symboliquement une expression, c'est 
l’évaluer dans un environnement insuffisamment décrit pour pouvoir 
utiliser un évaluateur classique. Evaluer symboliquement cette 
expression consiste à compléter la description de l'environnement sur 
la seule base des exigences de cette expression, et puis évaluer cette 
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expression normalement. 
LA META-EVALUATION 


Le domaine d'entrée de l’évaluateur EVAL du langage LISP est 
l’ensemble des couples «EXPRESSION , ENVIRONNEMENT» où EXPRESSION est 
une expression LISP, et où ENVIRONNEMENT donne accès à une liste de 
couples <IDENTIFICATEUR , VALEUR». 


Le domaine d'entrée du méta-évaluateur est l’ensemble des couples 
<a,h> où a et b sont respectivement une expression et un environnement 
méta-décrits. 

L'évaluateur symbolique admet que VALEUR soit méta-décrit, mais 
s'attend à ce que IDENTIFICATEUR et EXPRESSION soient des données 
concrètes. | | 

L'examen du langage LISP montre qu'il est nécéssaire que  l'évaluateur 
symbolique s'attende à ce aue IDENTIFICATEUR et EXPRESSION soient 
méta-décrits. IL doit être étendu en un méta-évaluateur. 


Exemple : 


Le langage LISP autorise l'usage d'arguments fonctionnels. Comprendre 
un programme qui possède des arguments fonctionnels, c'est pouvoir 
simuler l'application sur des données d'un programme  insuffisamment 
décrit, c'est-à-dire un schéma de programmes. 


Le tangage LISP permet, par exemple, qu'en position de fonction, dans 
une expression non atomique, se trouve une autre expression à évaluer, 
censée s'évaluer en une fonction qui sera alors appliquée sur les 
arguments. 


On peut écrire en LISP des programmes qui construisent d'autres 
programmes à partir de données, et qui les utilisent. | 


L'exemple suivant, simplifié, est tiré du générateur de conditions à 
vérifier de LIGARASHI 73] programme en VLISP. 


(DE FOO (a b) 
[A [a] 
[' SUBSTITUER 
['QUOTE a] 
['QUOTE 5111) 


(DE SUBSTITUER (s L) 


[note 1] Pour l’évaluateur symbolique présenté dans ce chapitre, 
l’environnement est une Liste de couples (identifieur,valeur). Le 
mode de définition de l’évaluateur symbolique laisse cependant la 
possibilité de détailler d’autres structures dans l’environnement. 
C'est ce qui est fait au chapitre 4, où l'on y introduit une pile pour 
Les fonctions d'échappement, et des tampons d'entrée et de sortie. 
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(SUBST (EYAL s) s D») 


Dans un contexte créé par un appel de FOO, SUBSTITUER remplace dans La 
Liste contenue dans Ll toutes les occurences de l'atome contenu dans s 
par la valeur de cet atome dans l'environnement courant. 

L'erreur contenue dans cet xemple est de méme nature que celle 
contenue dans Le programme FILTRER, exemple du paragraphe 4.1.1, 
quoique plus complexe. Les méthodes classiques de test sur exemples 
précis ne marchent donc pas plus. 
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o bti ifl me m immi tipi t am amari» s 


| Le résultat d'un appel de FOO est utilisé comme un programme et 


appliqué sur une valeur quelconque. Voici le comportement souhaité de 
l’évaluateur symbolique: | 


<((F00 ‘a 7b) ‘u) , Q0» 


| commentaire: le travail de FOO n'est pas détaillé. 
| Une fois sa valeur retournée, les liaisons de ses 
parametres formels sont détruites. 


| <((A (a) (SUBSTITUER "m a) (QUOTE b))) ’y) , {> 
| commentaire: L’évaluateur symbolique doit utiliser 
| ict des connaissances sur la syntaxe des A-expressions 


et se polariser sur le cas où a est un atome Litéral. 
| <(SUBSTITUER (QUOTE a) (QUOTE b) , {aszv}> 


Ee Va L) (SUBST (EVAL s) s 0) (QUOTE a) (QUOTE b)) 
» FV? > 


commentaire: pour affecter les valeurs symboliques a 


| à s et b à l, l’évaluateur symbolique tient compte des 
| possibilités: | 


| à-98 T ass, ar L 

< (SUBST ak s) s l) <(SUBST (EYAL s) s D < (SUBST d. s) s UD 
, {s=s > S= L , S-da 

l=b}> L=b}> L-b 

; | a=} > 

| (SUBST 's 's ’b) (SUBST 'b ’s "b) (SUBST | ‘a ‘b) 


(SUBST x y z) substitue x à y dans z. Seule La troisième branche 


* 


correspond à l'intention initiale, qui est de substituer dans b toute 
occurence de à par V. 
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L'évaluation symbolique fournit les exemples pour lesquels l'intention 
n'est pas satisfaite: 
1. ((F00 's 'DD ’y) 


2. ((FOO ’1 ' bo ’y) 
où s et L sont des atomes Litéraux et b et v des valeurs abstraites. 
LA RESOLUTION D'EQUATIONS 


Les définitions sémantiques des fonctions de base ne décrivent plus 
les raisonnements à effectuer devant tous les types de situations 
rencontrables. Ces raisonnements sont isolés en systèmes 
indépendants. Les définitions sémantiques se contentent de décrire 
statiquement le domaine d'entrée, de sortie, la relation fonctionelle, 
ou tout autre aspect que l'on veut exhiber dans les résultats d'une 
méta-évaluation. 


La fonction META-APPLY devient un poseur d'equations. Si par exemple 
La définition sémantique d'une fonction de base FCT exhibe une 
description 4711 , envi de son domaine d'entrées, 

(META-APPLY 'FCT 12 env2) 
entre autres, pose l'équation: 


«11 , envi = 412 , env2» 


C’est le système de raisonnement, indépendant du Langage de 
programmation, qui se charge de résoudre cette équation. 


exemple: | 
considérons l'exemple 1 du test LISP : 


(LAST (APPEND L M)) 


Lors de !a  méta-évaluation, Lorsque la  méta-valeur de La 
sous-expression (APPEND L M) est calculée : 


«(append 1 m) , {L = 1,M = m» 
La fonction LAST y est méta-appliquée: 
(META-APPLY ’LAST ’fappend 1 m) iL = 1,M = i5 
cet appel pose tour > tour les équations: 
1- «(append 1' (cons x nil)) , env» 
= «(append 1 m) , {L = 1,M = m» 


2- «() , env» 
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= «(append 1 m), iL m» 


il 
mal 
= 

H 


les définitions sémantiques des fonctions META-CAR et META-LAST: 


META-LAST: 


l~ «(append 1' (cons x nil)) , env» > «x , env» 


2- «() , env» = <f) , env» 


META-CAR: 
l- «(cons x 1') , env» > «X , env» 


2- «() , env» 5 «() , env» 


sont courtes et non redondantes. Les raisonnements communs à leur 
deux | défintions  procédurales sont isolés dans le système de 
raisonnement par résolution d’équat ions: | 


Le raisonnement commun à la | méta-évaluation des 2 formes 
(LAST (APPEND L M)) et (CAR (APPEND L MD) est la résolution de 
L'équation : 


(append a b) = (append c d) 


Pour l'exemple présent, les équations () se résolvent ainsi: 
l- (append 1' (cons x nil)) = (append 1 m) 
donne deux solutions: | 


- m = (append m’? (cons x nii)) 
if = (append 1 m') 


I 
- S 


"n li 


aa 1' (cons x nii)) 
2- () = (append 1 m) 


donne 1 solution: 


{) 
O 


- 1 
m 


t i 


Ces trois solutions fournissent le résultat escompté. 


http://www. artinfo-musinfo.org Rapport ATP 4273, octobre 1980, page 77 / 124 


-/6- 


UN SYSTEME DE REPRESENTATION DE SIGNIFICATIONS 


nem ——snnn— —————— P L— C Balade HÜa———D——À— eo 29 20 00 ilum i D mm 


Un système de compréhension automatique de programmes ne doit pas se 
contenter de décrire symboliquement la succession des états de la 
machine durant l'évaluation de L'appel d'un programme. Il doit 
fournir une signification de ce programme, objet formel à partir 
duquel les applications de la compréhension (diagnostics d'erreurs, 
extraction de propriétés utiles, annotations, vérifications, 
corrections) doivent être facilitées. Les représentations utilisées 
par le méta-évaluateur défini au chapitre 4, les listes de couples 
«valeur, environnement», sont insuffisantes pour représenter des 
programmes LISP. mE | 


Voici un système de représentation de significations de programmes. 
Ces représentations sont indépendantes d'un domaine de données (par 
exemple le domaine des listes, en LISP, sur lequel sont définies Les 
fonctions CAR CONS CDR NULL). Elles concernent le contrôle de 
L'évaluation : 


- conditionelles (IF COND AND OR SELECT) 
- itération (WHILE UNTIL MAPC MAPCAR DO) 
- appels à L’évaluateur (EVAL). 

- échappement (ESCAPE EXIT) 


- appel par nom ou par valeur (DE DF) 
(les exemples sont ceux du langage VLISP) 


Ces représentations tiennent compte également de : 


- définitions de structures de contrôle (DF et EVAL) 


- arguments fonctionnels, expressions incomplètement spécifiées 
(macro-génération dynamique de fonctions) 


- appels récursifs 


- entrées-sorties (READ PRINT) 


- programmation incrémentale (appels à des programmes non encore 
définis) 


Appliqué à une expression À et un environnement méta-décrit env, et 
s’il termine son calcul, te méta-évaluateur retourne une Liste de 
couples <valeur , environnement? tels que l’ensemble des formes 
[env > «valeur , environnement] décrit la fonction dénotée par A. Si 
A est le corps d'un programme (A PFS . A), alors l’ensemble des formes 
[XPFS , env» > «valeur , environnement], résultat de la 
méta-évaluation, est la définition sémantique associée à la 
A-expression. 


En appliquant le méta-évaluateur sur A dans l’environnement te plus 
global construit à partir de PFS, on peut obtenir une définition de La 
A-expression, à laquelle le méta-évaluateur peut se référer lorsqu'il 
a à comprendre une expression qui comporte un appel de cette 
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A-expression. Si une telle définition a été obtenue, le 
méta-évaluateur peut évaluer simplement une application de la 
A-expression sur des arguments concrets, toujours en se référant à la 
définition sémantique. 
exemple: 
à partir de la A-expression: 

CA CL M) GAST (APPEND L M))) (1) 
le méta-évaluateur obtient: 

«71 (append m (cons x nil)) , env» > «X , env» 

«(append 1 (cons x nil)) () , env» > «x , env» 


«() () , env» > «() , env» 


Ceci est un programme au' méme titre que (l. Le méta-évaluateur peut 
Simplement évaluer les appels : 


(0 labo lde) =e 
(D ’C€aboa ’Q) - C 
() 'O '(a 5D. = b 
@M 'O 'O) = () 


L'examen de cas concrets conduit à un concept de point de rupture qui 
permet de représenter de fagon uniforme des constructions aussi 
diverses que: 


- appels à l'évaluateur (fonction LISP EVAL) 


- définition de structures de contrôle (à l'aide des fonctions LISP DF 
et EVAL) 


- arguments fonctionels, schémas de programmes 
- programmes à appel par valeur ou par nom (fonctions LISP DE et DF) 
- définitions récursives 


- processus interactifs, non-terminants, à base d'entrées-sorties 


- programmation  incrémentale. Des programmes  incomplets, faisant 
appel à d'autres programmes non encore définis, peuvent toutefois 
être compréhensibtes. 
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Exemple : 
Voici la définition sémantique de (l'application de) EVAL: 
«(EVAL a) , {Lisyvi}> 
2 (point-de-rupture (2) 
<a , tLi=vi}> 


<a’ , (Li-vi')» = «a! , {Li=vi"}>) 


La forme (point-de-rupture exp . regles) indique que exp est une 
expression à méta-évaluer. regles est une continuation. 


Exemple : 
Les deux définitions : 
(DE F001 OO X) 
(DF F002 (L) (EVAL (CAR L))) 
sont presque équivalentes. C’est à dire que les appels : 


(FOOT E) 
(F002 E) 


où E est une expression LISP, fournissent la même valeur, par 
exemple : 


(FDO1 (CAR '(a b c))) a 
(F002 (CAR "(ab c))) = a 


Il 


5 


à l'exception d'une classe de cas, dont les appels : 


(FOOL (CAR L)) 
(F002 (CAR L?) 


sont un exemple. 
Si L = (abo), 


(F001 (CAR L)) = a 
(F002 (CAR L)) = (CAR L) 


F001 et F002 reçoivent respectivement tes définitions (l'atome 
point-de-rupture est abbrévié à PR): 


«(FOO1 EXP) , env» 
> (PR «EXP , env» 
«X , env'» 
> (PR «(LITER 'X ’x) , env?» 
«anc-val , env''» . 
> (PR <(DELIER X anc-val) , env''> 
env!!! = «x , env'!!>))) 
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qui, par connaissance de LIER et DELIER, se simplifie en: 


<(F001 EXP) , {L=anc-val}> 
2 (PR «EXP , {L=anc-val}> 
«X , {L=v}> > <x , {lsanc-vai}>) 


et: 
«(F002 EXP . Y) , env» 
> (PR «(GL IER "L ' (EXP . Y)) , env» 
«anc-val , eny'’> 
> (PH «EXP , env'> 
«X , env!'» 
> (PR «(DELIER L anc-val) , env''> 
env''' 5 «x , env!''»))) 


qui se simplifie en: 


«(F002 EXP . Y) , iL=anc~val}> 
> (PR «EXP , {L=(EXP . Y)}> 
<x , tL=u}> > <x , {L=anc-val}>) 


La différence entre F001 et F002 apparait à la forme (PR «EXP , env». 
Pour F001, EXP est évalué dans l’environnement de départ. Pour F002, 
l’environnement contient la Liaison supplémentaire L-(EXP . Y). 

Ces deux définitions exhibent à la fois les points communs de F001 et 
F002 (l'évaluation de leur premier argument) et leurs différences 


(pour F002, cette évaluation se fait aprés la liaison du paramètre L). 
Exemple : 
CAN transforme le programme : 


(DE FOO © 
(F CREAD)) 
(FOO) } 


où F est un programme quelconque, en : 


<(FO00) , env» 
> (PR <(READ) , env» 
«v , env'» = (PR «(F v) , env!» 
«v! , env''> 
> (PR «(FOOD , env''> 
yi? > v'1})) 


où V, v' et v'' sont des variables dont le domaine, est LV ensemble des 
éléments LISP. | | 


LE CALCUL CONCEPTUEL 


Le calcul conceptuel permet de représenter sous Le même statut les 
définitions sémantiques des unités syntaxiques de base, dont se sert 
le méta-évaluateur, d'un langage de programmation. 
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La méta-évaluation, appliquée à ces unités syntaxiques: 


- manipule plusieurs contextes, 
- compare des données méta-décrites (résolution d’équations). 


Ces deux fonctions sont construites à priori dans L’ interprète du 
calcul conceptuel et n'ont pas besoin d’être représentés dans la 
syntaxe externe. 


Ecrire un programme ou un schéma de programmes en calcul conceptuel 
permet de le tester sur des données méta-décrites, sans qu'il soit 
nécéssaire de modifier le programme. Le calcul conceptuel permet la 
méta-progremmat ion. 


exemple: 

Voici un concept qui définit La fonction LAST. LAST évalue son 
argument, s’attend à ce que la valeur soit une Liste, retourne © si. 
elle est vide, et son dernier élément sinon. | 


«(LAST L) , env» 
2 (point-de-rupture 
«L , env» 
«O , env'» = <O , env!» 
. «(append 1 (cons x nil)) , env'» 
| 2 «X , env'>) 


L'argument L de LAST peut être une expression quelconque. Le terme 
conceptuel <L , env», premier argument du point de rupture, fait 
référence aux définitions conceptuelles présentes, s’il y en a. 
évaluer une forme (LAST expression) en calcul conceptuel, c’est donc 
d'abord évaluer expression, puis comparer les résultats obtenus avec 
chacun des termes conceptuels gauche des concepts du point de rupture: 
<Q , env'» et «(append 1 (cons x nil)) , env'>. Chaque concept 
fournit une valeur et un environnement résultant de l'évaluation de 
L'expression. 


La régle de composition est la principale régle de simplification du 
calcul conceptuel. étant donnés deux concepts [tl > t2] et [t3 > t4l, 
où ti, t2, t3 et t4 sont des termes conceptuels, elle transforme la 
composition: 

[tl > t2lolt3 > t4] 


en un ensemble de concepts de la forme: 
[E 5 F] 


Si un concept est interprété comme une procédure à  invocation par 
résolution d'équationlnote 1], alors le point de rupture peut être 
interprété comme: 


(point-de-rupture appel-de-procédure . continuation) 


La règle d'équilibration relie Les concepts entre eux. 
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La régle du cercle vicieux : 


- Du point de vue de la méta-évaluation, la règle du cercle-vicieux 
permet d’arréter des calculs récursifs sur des données méta-décrites 
Lorsqu'il est certain qu'aucune nouvelle information ne peut être 
obtenue. 


- Du point de vue de ta compréhension de programmes et de ta 
construction de définitions à partir de programmes, ia régle du 
cercle-vicieux permet de ne pas se contenter d’arrêter La 
méta-évaluation à chaque appel récursif, et de poursuivre lorsque 
L'appel récursif n'est pas équivalent à l'appel d'origine. 


La régle d'induction constructrice est un rouage indispensable de la 
compréhension de programmes. Le systéme CAN obtient à partir de 
définitions récursives ou itératives des définitions conceptuelles 
dont il se sert pour effectuer des simplifications impossibles par 
simples pliages et dépliages des définitions récursives. 


L'évaluation 


Le calcul conceptuel permet d'évaluer un terme conceptuel de base dans 
un contexte formé d'un ensemble de concepts, de la méme maniére qu'il 
est possible, en LISP, d'évaluer une expression dans un contexte de 
définitions de fonctions. 


Evaluer un terme de base t (sans variable) en calcul conceptuel, c'est 
appliquer la règle d’équilibration sur le concept: 


[t = (PR t 
t' 2 t’)] 


où le concept [t' > t’] représente le fonction identité partout 
définie. 


L'évaluation symbolique 


Une évaluation intermédiaire entre cette | évaluation et La 
méta-évaluation, l'évaluation symbolique, admet que le terme à évaluer 
soit un terme conceptuel quelconque. Ce terme est une donnée 
symbolique, ou méta-décrite. C’est la représentation symbolique d'une 


classe infinie de termes conceptuels de base. 


La règle de composition doit résoudre des équations t-t' où t et t’ 
sont des termes quelconques. 


[note 11: Les «langages PLANNER [HEWITT 72] et CONNIVER 
[Mc.DERMOTT 72] 3 ont introduit la notion de “pattern directed 
invocation", ou invocation par filtrage. La notion d’invocation par 
résolution d'équation en est une extension. Un exemple particulier 


d’ invocation par résolution  d'équation est L’ invocation par 
unification en PROLOG [ROUSSEL 751. 
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Dans le cas où les termes conceptuels ne contiennent que des variables 
d'élément, la résolution d'équations se Limite à l’unification 
robinsonienne [ROBINSON 65]. Les règles de composition et 
d’équilibration correspondent aux règles d’évaluation de clauses de 
HORN, en logique des prédicats, interprétées comme des procédures 
[VAN EMDEN 76]. La régie de résolution [ROBINSON 651, interprétée 
comme une régle d'invocation de procédure, correspond aux deux règles 
de composition et d'éguilibration. 


La méta-évaluation 


Etant donné un concept interprété comme une forme à méta-évaluer, la 
règle d’équilibration peut en général s'appliquer de plusieurs 
manières. Elle peut s'appliquer sur le concept lui-même, et sur 
chacun de ses sous-concepts. | | | | 

La méta-évaluation impose un choix simple pour l'application de la 
règle d’équilibration. Etant donnés un concept et un ensemble de 
choix d'application, la règle d'éguilibration est appliquée sur Le 
concept Le plus extérieur. Si le concept n'est pas modifié par La 
règle d’équilibration, alors elle est réappliquée sur le second 
Sous-concept le plus extérieur. S'il est modifié, le processus 
recommence. Ce processus termine lorsque la régle d'éguilibration ne 
peut plus modifier le concept. 


L'Analyse de proorammes récursifs 


Les buts d'une analyse de programmes récursifs, une fois représentés 
conceptuellement, sont de : 


- décrire les classes de données pour lesquelles ie calcul ne termine 
pas, ou le programme n'est pas défini. 


- déceler les portions de code non utilisées, ou les chemins 
impossibles 


- décrire de façon statique l'activité d'un programme. 
- exhiber des inefficiences 


- reconnaître l'équivalence sémantique profonde de deux programmes. 


3 


Exemple : 


Au programme LISP qui concatène un nombre quelconque de Listes : 


(DE CONC (L) 
(COND (NULL L) NIL) 
CCNULL (CAR L)) (CONC (CDR L))) 
(T «CONS (CAAR L) 
(CONC (CONS (CDAR L) (CDR L))))))) 
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correspondent les trois concepts : 


i- (CONC (D + [) 
2- (CONC (() . 7) > (PR (CONC D 
1! > 71) @ 
3- (CONC ffx. y). ID = (PR (CONC fy . 7) 
j»(x.0p 


Par application de la règle d’équilibration sur chacun de ces 
concepts, 
on obtient le graphe de dépendance : 


V | 
| 2 
| 
: x | 
qui exhibe 1 comme condition d'arrét, et montre qu’aucun arc ne relie 
3 à 1. Le chemin 3-1 est impossible. L'appel récursif de la 


troisième clause de CONC ne conduit pas directement à la condition 
d'arrét de CONC. 


~ 


La règle d'induction peut être appliquée sur 3, puis le résultat 
équilibré avec la règle 2 de CONC : 


1- (CONC (D > f) 
2- (CONC (() . 7)) > (PR (CONC 7) 
1! > 1^) 8 
3- (CONC ((xl ... xn) . 1p 
+ (PR (CONC 7) 
1! > (xl... xn. 1p 


Les résultats obtenus peuvent a nouveau être compactés en utilisant 
une règle d’ absorption. La règle d'absorption réunit en un seul 
concept le résultat de lL’ induction et Le concept avec lequel ce 
résultat est équilibré. 


À la place de (3, on obtient : 
1- (CONC f)) 5 () 
3- (CONC f((x1 ... xn) . 1D 


> (PR (CONC 7) 
1! > (xl... xn. Y) 


http://www.artinfo-musinfo.org Rapport ATP 4273, octobre 1980, page 85 / 124 


-84- 


Ce dernier exemple illustre particulièrement l'avantage de la règle 
d'absorption, puisque le graphe de dépendance de CONC est réduit à : 


> [3] »[1| 
L| 


ce qui, par induction, équilibration et absorption, est compacté en : 


(CONC (fx11 ... xni) ... (xim ... xnm))) 
> {xil ... xnl ... xim ... xnm) 


ARIOMATISATION DES PRIMITIVES LISP 


Le système CAN de comnréhension automatique de programmes LISP est 
fondé sur Les règles du calcul conceptuel: composition, 
équilibration, cercle-vicieux, induction constructrice. 


Les régles du calcul conceptuel supposent une axiomatisation des 
domaines sur lesquels il est appliqué. Cette axiomatisation sert 
principalement la règle de composition, dont le rôle est de simplifier 
des expressions en concepts. Ces axiomatisations sont des systèmes de 
résolution d’équations. 


Les axiomatisations requises par le calcul conceptuel procèdent de 
principes différents de ceux des axiomatisations classiques, destinées 
à être utilisées par des mathématiciens, ou utilisées par des systèmes 
de démonstration automatique. En particulier, elles ne sont pas 
basées sur le principe d'économie, visant à réduire au maximum te 
nombre d’axiomes de base. Le calcul conceptuel demande au contraire 
d’ importants systémes de déduction. Ces systémes de déduction doivent 
minimiser les choix d'utilisation d'axiomes à chaque pas du processus 
de résolution d'équations. 


En effet, le calcul conceptuel est censé obtenir ses résultats le plus 
rapidement possible, indépendamment des moyens utilisés. La 
résolution d'équations qu'utilise le calcul conceptuel ne doit pas 
s'engager dans des recherches arborescentes. Elle ne doit pas 
résoudre de probléme. Elle constitue le pouvoir déductif de la 
compréhension de programmes. Ceci distingue la résolution d'équations 
dans te système CAN des systèmes axiomatiques qui cherchent à 
atteindre leurs buts avec Le minimum de moyens. 


La représentation de La fonction APPEND comme une fonction à deux 
arguments oblige à utiliser certains axiomes comme l’associativité et 
l’élément neutre à gauche et à droite. Ces axiomes et les déductions 
qu'ils permettent peuvent être intégrés dans un mode de 
représentation. De même peuvent y être intégrées les relations entre 
les fonctions CAR CDR CONS. 


Nous utilisons les variables de séquence : 
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(APPEND L M) s'écrit (?L ?MD 


où ?L et ?M ont pour domaine l'ensemble des séquences d'éléments, y 
compris la séquence vide. 


(APPEND L NIL), par exemple, se représente (?L) 
APPEND est défini ainsi : 


(APPEND (€?L) €?M)) = C?L ?M) 


Cette représentation automatise l’utilisation de 
l’associativité-élément neutre de APPEND, et par l’utilisation de 
variables d'élément, distinguées par un "!", elle permet de définir 


CAR CDR CONS indépendamment les unes des autres: 


(CAR (IA ?B)) = IA 
(CDR (IA ?B)) = (?B) 
(CONS IA (?B)) = CIA ?B) 


Cette représentation uniforme des fonctions CAR CDR CONS APPEND à 
partir de filtres permet de réduire les systémes de simplification et 
de résolution d'équations à la comparaison de filtres [GOOSSENS 78c1. 


L'utilisation de variables d'élément typées permet de définir 
conceptuellement Les primitives d'un langage de programmation qui 
servent de connecteurs logiques. En LISP, par exemple, on peut 
définir: | 


CAND 1X1 ... IXn) = si (META-EVAL !X1)=NIL alors NIL 
sinon 
CAND !X2 ... IXm 
(AND = T 


(OR !X1 ... IXn) = si (META-EVAL IX1)-NIL 
ators (OR !X2 ... !Xm 
sinon 
(META-EVAL !X120«!Y 
ly 
(OR) = NIL ‘ 


(IMPLIES IX IV) = si (META-EVAL !X)=NIL alors T 
sinon 
(META-EVAL !X)=!Z 
(META-EVAL !Y) 


(NOT IX) = si (META-EVAL !X)=NIL alors T 
sinon NIL 


(les variables soulignées ne peuvent être associées à la valeur LISP 
NIL. Du point de vue de la méta-évaluation, les définitions ci-dessus 
n'exhibent que le contrôle que les fonctions ont sur LV évaluation de 
leurs arguments. Les modifications qu'elles entrainent sur 
l’environnement courant ne sont pas considérées). 


Les variables d'élément typées permettent également de définir tes 
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Bs 
prédicats de base (ex: ATOM, NUMBP, LISTP, STRING en LISP). 
exemple: 


(ATOM latom) = T 
(ATOM !lratom) = NIL 


ou latom et !watom sont respectivement une variable dont Le domaine 
est l'ensemble des atomes LISP et une variable dont le domaine est 
l’ensemble des éléments non atomiques. 


Ces accomodations permettent d’ étendre tes résultats théoriques de 


b 


l’unification de chaines aux expressions formées à partir des 
primitives CAR CDR CONS NOT ATOM NUMBP STRING APPEND AND OR IMPLIES 
EQUAL. | | 


La définition de APPEND: 
(APPEND (?A) (?B)) = (?A ?B) 


améliore la définition classique: 


(APPEND NIL D =L 
(APPEND (CONS X Y) L) = (CONS X (APPEND Y L)) 


qui ne permet pas de simplifier Les formes : 


(APPEND L NIL) 

(EQUAL (APPEND L M) L) 

(EQUAL (APPEND L M) NIL) 

(EQUAL (APPEND L M) (APPEND L ND) 
(EQUAL (APPEND L L) (APPEND M MD) 


de méme, la définition: 


(REVERSE NIL) = NIL 
(REVERSE (CONS X Y)) = (APPEND (REVERSE Y) (CONS X NIL)) 


ne permet pas de simplifier les formes : 
(REVERSE (APPEND X (CONS Y NIL))) 
(REVERSE (APPEND L MD) 
(REVERSE (REVERSE X0) 
(EQUAL (REVERSE X) X) 
elle est améliorée par cette définition, utilisée par le système CAN: 
(REVERSE (!X1 ... !Xm) = ClXn ... 1X1) 
qui s'écrit: 


n n 
(REVERSE (<L IX >)) = (<L IX >) 
i L i n-i+1 
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Ce genre de définition demande à accepter un nouveau type de variable 
pour construire des filtres, les notations indicées. | 


Les notations indicées 


Pour définir conceptuellement des fonctions courantes de manipulation 
de Listes comme les fonctions LISP REVERSE, MEMBER, ASSOC, NTH, 
LENGTH, il faut utiliser un nouveau type de variable dont la syntaxe 
est: 


p+ | 
<L FILTRES» 
indice 


Pour admettre ce nouveau type de variable, il faut également admettre 
des filtres numériques (p+ doit être un filtre numérique) et 
s'attendre à ce que les varisbles d'élément et de séquence soient 
indicées. Les filtres numériques sont exposés au paragraphe 8.2.6. 


Cette notation indicée utilisée par le système de résolution 
d'équations défini au paragraphe 8.2.5.3, se définit algébriquement 
comme le type abstrait LGUTTAG 77, BERT 791 suivant: 


type VSC (variable de séquence contrainte) 
spécification syntaxique: 


GEN : indicexfiltre-numériquexfiltre » VSC 
PREMIER : VSC > filtre 

COUPE-DROITE : VSCxfiltre-numérique > VSC 
COUPE-GAUCHE : VSCxfiltre-numérique = VSC 
ETENDRE : VSCxentier-positif = VSC 
DECALAGE-CIRCULAIRE : VSCxentier-positif = VSC 
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sémantique: 


0 
(PREMIER (GEN i n pp? = pj. 
L 


i--m 


(COUPE-DROITE (GEN i n p) m) = (CEN i n-m p] P 


L 


(COUPE-GAUCHE (GEN i n p) m = (GEN i m p) 
(ETENDRE (GEN i n p) a) 
| axi lexCi-1) 
=(GEN i n/a p| pi. sas D 
i L 
(DECALAGE-CIRCULAIRE (GEN i n p) a) 
= Si a<|p| 


*Ci-CGa-1)) 
) 


0 
((npremiers a p) 


EE 
(GEN i n-1 (saufpremiers a p) 


i+] 
) 


(npremiers a p) 


L 


n-1 
(saufpremiers a p) 


. 


L 


NOMBRES 


~ 


Les représentations conceptuelles de Listes abstraites à l’aide de 
notations  indicées exhibent des longueurs abstraites sous la forme de 
filtres numériques, c'est-à-dire à interpréter comme des classes 
d'entiers positifs. 


Les manipulations d'entiers en LISP conduisent à des problèmes de 
compréhension qui reviennent Le plus souvent à décider de la valeur 
d'une forme: 


(relation expl ... expn) 


où relation est une des relations de base en LISP: <, >, <=, >=, =. 
et où les expi sont des expressions numériques. 


Du point de vue de la compréhension de programmes de traitement de 
Listes, il faut particulièrement s'attacher au cas où les expi sont 
des expressions sur les entiers positifs, formés à partir de 
addition et la soustraction. 

En choisissant les définitions conceptuelles: 


(PLUS XI ... Xn) = Kle ... +Xn 
(DIFFER X«Y Y) =X 

(DIFFER X X+Y+1) = 0 

(<= X X+) =T 

(<= X+Y+1 X) = NIL 

(>= X X+Y+1) = NIL 

(>= XY X = T 
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(< X X+¥41) = T 
(< X+Y X) = NIL 
(> X X+¥) = NIL 
(> X++ XX) = T 


Le problème auquel la résolution d'équations doit faire face se réduit 
à la résolution d'équations du type: 


alX1 + a2X2 +... + anXn + antl = blYl +... + bmYm 


où les Xi et les Yi sont des variables dont le domaine est celui des 
entiers positifs et où les ai et Les bi sont des coefficients 
numériques constants, entiers et positifs. | 


Ce problème est un problème de résolution d’équations dionhantiennes 
ISTICKEL 73, HUET 781. L'algorithme  d'unification qu’utilise 
actuellement le système CAN n'est pas minimal. IL consiste en 
l’unifieur de séguences abstraites (règle 13, SUIVANT, SUIVANT 
CONDITIONE!) auquel s'ajoute une règle de simplification qui élimine 
les variables et constantes communes aux deux termes à unifier. Cet 
algorithme d’unification tient donc compte des propriétés de 
commutativité, associativité, élément neutre de +. 


LE SYSTEME CAN 


Le système CAN est un système de compréhension de programmes LISP, 
implémenté en VLISP [GREUSSAY 77, CHAILLOUX 801 sur un PDP KL-10. It 
est basé sur les processus de méta-évaluation et de construction de 
significations exposés dans cette étude. 

CAN fournit une description fonctionelle (sans effet de bord) des 
programmes qui lui sont soumis, et en simplifie la structure de 
contrôle. Cette description prend la forme d'un ensemble de concepts 
(éléments du calcul conceptuel défini au chapitre 7). Un programme 
est ainsi divisé, par l'analyse de cas opérée par méta-évaluation, en 
modules  interdépendants. CAN construit et analyse le graphe.de 
dépendance de cet ensemble de modules. 

Cette description modulaire est ensuite compactée par induction, 
autant que le permettent les notations spéciales utilisées par CAN, et 
Son pouvoir de résolution d’équations (chapitre 8). 


En analysant leur graphe de dépendance, CAN est capable d'extraire des 
programmes qui lui sont soumis : 

- des portions de code non utilisées 

- des chemins impossibles 


- des classes de données pour lesquelles le programme ne termine pas 
son calcul | 


- des redondances 


Exemples : 
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Le programme MEMLONG suivant vérifie si deux Listes ont la méme 
longueur : 


(DE MEMLONG (L M) 
(COND ((ONULL L) (NULL M) 
CCNULL M) NIL) 
(T (MEMLONG (CDR L) (CDR M))))) 
réponse de CAN : 


(MEMLONG IL !M 5 > 


Point-de-rupture E IL IM] 


Hon Ww ow m nm 


(NIL !5 ) 5 NIL 
( 13 NIL) > NIL 
(C (Lei 7NS+> 1900) € (Lei PNB4> 1141 DD) 5 T 
(C (ei ?N24» 19i D) 
( («i ?N24»  !14i ) 247 )) 5 NIL 
(C («i ?N2+> !9i ) 754) 
( (ki ?N2+> !14i ))) > NIL 


oun Wn m H 


Voici une définition incomplète de la fonction MEMBER : 


? (DE MEM (X L) | 

? CIF (EQUAL X (CAR L)) 
? L 

? (MEM X (CDR L)))) 
= MEM 

? 

? (CAN 'MEMD 


(MEM IX IL ) > 


Point-de-rupture [ IX IL] 


yu Ww wm u i 


( NIL 
C (Lei 2N2+> !161i0 / (NIL = 1161i ))) ) > NIL 


€ 1162 
( (Lei ?N3+> !16li / € 1162 # !161i )))) 
> € 1162 NIL) : CALCUL INFINI 


B of d m Ml 


1166 
C (Lei ?N4+> 1161i /( 1166 = !161i )) 1166 ?168 ) D 
> ( 1166 7168 ) f 


H HW E M 
rs 


La classe de données pour lesquelles le calcul ne termine pas peut 
être décrite par : "les cas où X n'est pas un élément de la Liste L" 
mais cette description exclut le cas particulier, que CAN décèle, où X 
a La valeur NIL. Dans ce cas, le calcul termine aprés que MEMBER ait 
parcouru toute la Liste. 
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POUVOIR REPRESENTATIF 


CAN utilise les résultats de la méta-évaluation d'un programme pour en 


construire une définition. 

Pour mettre la méta-évaluation au service de la compréhension de 
programmes, nous avons dû généraliser les notions déjà connues 
d'évaluation symbolique, ou exécution symbolique. Cette 
généralisation a ainsi permis de tenir compte des fonctions LISP EVAL, 
SET et DF permettant un style de programmation particulièrement riche, 
puisque l'utilisateur peut définir et utiliser ses propres structures 
de contróle, et écrire des programmes qui construisent et utilisent 
d'autres programmes. | 


Nous avons, par Le calcul conceptuel, défini une hase de 
représentation équivalente aux clauses de HORN  IKOWALSKI 731, 
fondement du langage PROLOG [ROUSSEL 751, mais ouverte vers les 
extensions nécessaires à la compréhension de programmes : 


- notations spécialisées évitant l'emploi de règles de simplification 
fréquemment utilisées 


- définitions récursives compactables par induction et utilisables 
comme règles de simplification 


Ces extensions nous ont permis d'appliquer le calcul conceptuel, dans 
le cadre de CAN, à la compréhension de programmes LISP. CAN est ainsi 
capable d'associer à un programme LISP une définition du calcul 
conceptuel, puis, si elle comporte des appels récursifs, de la 
compacter, c'est à dire de la débarasser de ses appels récursifs pour 
la rendre utilisable en tant que règle de simplification. 


Exemple : 


A partir de l'axiomatisation des fonctions CAR CDR CONS APPEND NULL 


(CAR (CONS X Y)) 
(CDR (CONS X Y)) = 


il 


X | 
Y 

(NULL ©) = T 

(NULL (CONS X Y)) = NIL 


(APPEND © D = O 
(APPEND (CONS X Y) L) = (CONS X (APPEND Y L)) 


et des règles d’inférence du calcul conceptuel, CAN peut, directement, 
prouver les théorèmes : | 


CAPPEND X (APPEND X X)) = (APPEND (APPEND X X) X) 
[CAPPEND X X) = (APPEND Y 1 => X = Y 


mais aussi simplifier les expressions : 
(APPEND X (APPEND Y Z)) = (APPEND (APPEND X W) Z) 


en Y = M 
(APPEND L M) = (APPEND L ND 
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en M = N 
CAPPEND L L) = (APPEND M M) 
enL=M 


POUVOIR DEDUCTIF 


Le calcul conceptuel sans notations spécialisées (variables de 
séquence, notations indicées) offre un pouvoir renrésentatif 
équivalent à LISP. Cependant, il faut introduire des notations 
spécialisées pour développer le pouvoir déductif. 

Le pouvoir déductif de CAN prend la forme de systèmes de résolution 
d'équations qui tiennent compte de tla présente des notations 
spécialisées. C'est l'extension par ajout de notations spécialisées 
et de systèmes de résolution d'équations qui différencie CAN des 
systèmes de vérification et de compréhension de programmes fondés sur 
la logique des prédicats. 

Cette voie est à rapprocher des tentatives de remplacement, dans un 
démonstrateur de théorèmes, d'axiomes fréquement utilisés (comme les 
propriétés d'associativité et de commutativité) par des procédures 
d’unification spécialisées [PLOTKIN 72, STICKEL 75, SIEKMANN 751. 
Nous avons contribué à ces tentatives par l'ajout de notations 
spécialisées qui tiennent compte des propriétés particulières des 
fonctions LISP REVERSE, MEMBER, ASSOC, NTH, LENGTH, LAST. CAN est 
également capable, à partir d'une définition LISP, d'en dériver une 
description à base de ces notations spécialisées et donc d'utiliser 
son pouvoir déductif pour en comprendre les utilisations. 


CAN peut être vu dans son état actuel, comme une première tentative 
d'adjoindre à tout système à trés longue durée de vie, une composante 
d'auto-compréhension nécessaire pour doter ce système d'une large 
capacité d'auto-maintenance. 

Ceci peut donner à penser que l’action ponctuelle et dominante du 
programmeur actuel sur un système à construire ou à améliorer, fera 
place à trés long terme, à une interaction programmeur-systéme, où. 
l’initiative du système pour les décisions concernant sa conception 
sera de plus en plus importante. 
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